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摘要 : 选取 竹 亚 科 中 两 个 超 族 、 六 个 族 和 三 个 亚 族 的 10 个 竹 种 为 材料 ,分 别 是 泰 竹 、 凤 尾 人 竹 、 青 皮 竹 、 
KIR, A, BRETT. BIT. AT. AT. EAI, DA eM FETA lea3 基因 ， 并 将 它们 与 外 类 和 群 物 
种 水 稻 进行 序列 比 对 和 进化 分 析 。 结 果 发 现在 分 支 模型 与 分 支 位 点 模型 的 检测 中 ， 不 同 竹 种 所 含 lea3 基 














































































































因 承 受 了 不 同 的 正 选 择 压 力 ， 清 除 选择 作用 在 lea3 基因 编码 区 中 占 主导 地 位 (w<1)。 在 位 点 模型 的 检测 
中 ， 共 检测 出 了 18 个 显著 性 正 选 择 位 点 ， 占 总 氨基 酸 数 目的 11. 1%。 对 这 18 个 显著 性 正 选 择 位 点 进行 定 
位 后 ， 发 现 其 中 的 15 个 位 于 11 个 氨基 酸 串 联 重复 序列 附近 。 这 说 明 lea 基因 中 的 11 个 氨基 酸 串联 重复 
序列 区 比 基 因 其 它 区 域 更 容易 受 自然 选择 作用 有 影响。 同时， 在 位 点 模型 检测 结果 的 基础 上 ， 通 过 对 强烈 清 
除 选择 位 点 的 定位 ， 发 现在 11 个 氮 基 酸 串 联 重复 序列 区 内 存在 一 长 段 无 强烈 清除 位 点 的 序列 区 。 

关键 词 : POW; lea3 HEA; 基因 克隆 ; 进化 分 析 
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The Evolutionary Analysis of lea3 Gene in Bambusoideae 


YU Li-Xia, LI Bin, HUANG Hai-Quan, YAN Bo” 
(Southwest Forestry University, Faculty of Landscape Architecture, Kunming 650224, China) 


Abstract; The 10 bamboo species for cloning lea3 gene concern two superfamily, six families and three subtribes , 
they are Thyrsostachys siamensis , Neosinocalamus 
affinis , 


Sasa fortunei. In the branch model and branch site model test, found that different bamboo species containing lea3 


Bambusa multiplex, Bambusa textilis, Dendrocalamus farinosus , 


Dendrocalamus semiscandens, Phyllostachys heterocycla, Chimonocalamus delicates, Pleioblastus amarus , 
gene under different selection pressure, purifying selection function is in dominant ( omega< 1). In the site model 
test, detected a total of 18 significant positive selection sites, account for 11. 1% of the total amino acid number. Lo- 
cating the 18 significant positive selection sites, found 15 sites located 11 amino acid tandem repeat sequences are- 
as, this means that 11 amino acid tandem repeat sequences areas of /ea3 gene than in other regions more easily affected 
by natural selection effect. At the same time, based on the results of the site model test, through located these intence 
purifying selected sites, found a long no purifying selection sites area in 11 amino acid tandem repeat sequences. 


Key words; 


Bambusoideae; lea3 gene; Gene cloning; Evolutionary analysis 





随 着 对 LEA 蛋白 研究 的 深入 ， 通 过 分 子 杂 
可 以 将 LEA 蛋白 分 成 6 


(TAQAAKEKAGE) (Baker 等 ，1988 ) , 


可 形成 a- 
螺旋 结构 。 在 不 同 物种 之 间 ， 第 三 组 LEA 蛋白 


个 族 (Battaglia 等 , 2008; Dure 等 ，1989; Dure, 





的 同 源 性 差异 较 大 。 例 如 ， 大 麦 与 小 麦 在 氨基 酸 

















1993; Ingram 和 Bartels, 1996)。 第 3 族 LEA Œ 水 平 上 同 源 性 分 别 达 91% 和 95% ， 但 它们 与 同 
白 含 有 多 拷贝 的 由 11 个 氨基 酸 组 成 的 基 元 序列 是 禾 本 科 的 水 稻 、 玉 米 、 蒙 古 冰 草 的 同 源 性 却 只 
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有 60% 左 右 。 第 三 组 LEA 蛋白 在 属 内 相对 保守 ， 
而 在 属 间 变 化 较 大 〈 汤 晓 倩 ,2010) 。 

中 国 竹 亚 科 共 含有 2 超 族 、6 族 、5 亚 族 、 
和 43 属 ; 中国 竹 亚 科 分 种 ( 含 变 种 、 变 型 ) 检 
索 表 中 ， 有 708 种 、52 变种 、98 变型 和 4 个 杂 
交 人 竹 种 ( 易 同 培 等 ,2009)。 本 人 研究 中 所 用 到 的 
10 个 位 种 分 别 属于 竹 亚 科 中 的 2 个 超 族 、6 个 族 
和 3 个 亚 族 ， 它 们 分 别 是 丘 竹 超 族 泰 竹 属 的 泰 竹 
(Thyrsostachys siamensis ) ; 箱 竹 超 族 箱 竹 族 箱 竹 
JR H AJE Nr ( Bambusa multiplex) 与 青皮 人 竹 
( Bambusa textilis); ii (TRAIL WR RNT JR AY BK 
竹 (Neosinocalamus affinis) PUHE NT JR AY KM 2A 
( Dendrocalamus farinosus) ， 征 竹 超 族 牡 竹 族 牡 竹 
属 的 野 龙 人 竹 (Dendrocalamus semiscandens) , RNY 
ETRE TRE IRWIN AEP (Phyllostach- 
ys heterocycla) , IŽ Fi PTR INS REM 
的 香 竹 (Chimonocalamus delicates) ， 北 美 箭 竹 超 
族 北美 箭 竹 亚 族 苦 人 竹 属 的 兰 竹 ( Pleioblastus am- 
arus) ， 以 及 北美 箭 竹 超 族 赤 人 竹 亚 族 赤 人 竹 属 的 菲 
和 白 竹 (Sasa fortunei) 。 

基因 水 平 的 适应 性 进化 指 一 个 遗传 群体 以 一 
种 具有 较 高 适合 度 的 等 位 基因 替代 另 一 种 等 位 基 
因 的 过 程 。 检 测 适 应 性 进化 有 助 于 理解 生物 进化 
历史 及 相关 生物 结构 与 功能 变异 。 在 自然 选择 作 
用 下 ， 基 因 的 适应 性 进化 方式 通 管 有 三 种 ， 包 括 
正 选择 、 负 选择 和 中 性 选择 (RIÉ, 2009), Æ 
分 子 进化 研究 中 ， 有 效 检 测 达尔 文正 选择 的 统计 
学 方法 是 比较 核 苷 酸 序列 上 密码 子 的 非 同 义 替 换 
(nonsynonymous substitution ， 氮 基 酸 变化 ) 与 同 
义 替 换 (synonymous substitution ， 氮 基 酸 不 变 ) 
比率 (w=dN/dS) 。 用 比率 可 以 检测 编码 蛋白 序 
列 所 受到 的 选择 压力 ， 进 而 揭示 三 种 不 同 的 进化 
选择 情况 : 当 dN<dS (w<1) 时 为 负 选 择 ; 4 
dN>dS (w>1) 时 为 正 选 择 ; “4 dN=dS (w=1) 
时 为 中 性 突变 〈 章 张 , 2007)。 


















































1 材料 与 方法 

1.1 材料 

1.1.1 植物 材料 ”实验 所 用 材料 为 幼 嫩 叶 片 ， 泰 竹 、 凤 
FE, ART, KURA, BA, EE, ET. TT. 
TTT, AR ATT 10 个 实验 竹 种 均 采 于 西南 林业 大 学 人 竹 园 ， 
由 该 校 孙 茂盛 老师 鉴定 。 





1.1.2 主要 试剂 与 菌 种 ”TIANGEN 公司 的 植物 总 RNA 
提取 试剂 盒 、TIANGEN 公司 的 PCR 产物 回收 纯化 试剂 
盒 、TAKARA 公司 的 DL2000Marker; 逆转 录 酶 M-MLV 
(RNase H) RTase oligo (dT), dNTPs, Taq DNA polymer- 
ase, TAKARA 公司 的 克隆 载体 pMD18-T Vector; PCR 时 
所 用 到 的 各 种 试剂 均 购 自 于 北京 易 国 生物 公司 与 TIAN- 
GEN 公司 ， 其 它 常规 化 学 试剂 购 于 北京 易 国 生物 公司 。 

大 肠 杆菌 DH5sa 为 本 实验 室 保存 菌 种 。 
1.2 方法 
1.2.1 植物 材料 的 处 理 ”将 所 摘 取 的 新 鲜 竹 叶枝 条 放置 
在 室温 下 脱水 2~4h。 
1.2.2 RT-PCR 和 序列 拼接 ”对 处 理 的 竹子 叶片 采用 液 
气 人 研磨 法 ， 利 用 RNAsimple Total RNA kit (北京 天 根 ) 
提取 总 RNA， 并 用 First-Strand RT-PCR kit (大 连 宝 
物 ) 合成 cDNA 第 一 链 ， 道 转录 引物 为 dTP， 其 他 按 操 
作 说 明 进 行 。 

以 上 述 合成 的 cDNA 第 一 链 为 模板 ， 应 用 禾 本 科 植 
物 lea 基因 保守 区 域 通 用 引物 FP, RP 扩 增 目的 序列 
(Yu 等 , 2010)， 扩 增产 物 连接 到 pMD18-T 载体 上 并 进 
行 测 序 ， 根 据 测序 结果 设计 出 第 一 轮 3' race 引物 Fl 
(上 游 ) : 5'-AARGCGYRSGAGGCCAAGGAC-3’, 3’ race 
引物 R1 (下 游 ) : 5'-CCAGTGAGCAGAGTGACGAGG-3'; 
第 二 轮 3' race 引物 F2 (上 游 ) : 5’-GCCGGCAAGGA- 
CAAAACCGGC-3', 3' race 引物 R2 (下 游 ) : 5'-GACGA- 
GGACTCGAGCTCAAGC-3'。 利 用 套 式 PCR 对 3' 端 序列 
进行 扩 增 ， 反 应 体系 参照 相关 文献 〈 于 丽 震 等 , 2010 ) ， 
两 轮 反 应 的 退火 温度 均 为 62 CC ， 模 板 为 稀释 10 倍 的 第 
一 轮 PCR 产物 。 所 获得 的 3' 端 片段 经 克隆 测序 后 ， 与 已 
获得 的 相对 保守 片段 拼接 ， 得 出 部 分 cDNA 序列 。 
1.2.3 基因 树 的 构建 与 分 析 用 于 建树 的 外 类 群 为 水 
稻 。 在 建树 之 前 ， 先 对 序列 进行 适当 处 理 ， 具 体 方法 如 
F: 1) BARBIE IIA MEGA PAY “Translated Protein 
Sequences” 转换 成 氨基 酸 序列 ; 2) 用 其 中 的 “Align by 
ClustalW” 进行 序列 比 对 ; 3) 将 比 对 结果 转换 成 “DNA 
Sequences”; 4) 手动 去 除 其 中 的 “Gap”; 5) 采用 最 大 
似 然 法 (maximum likelihood， 简 称 ML) 构建 。 在 构建 树 
之 前 ，bootstrap 值 全 部 设 成 1000。 然 后 将 ML 树 文件 及 
原 有 序列 文件 转 入 PAML 软件 (Yang 等 , 2007) F, 在 
调试 好 各 种 参数 后 运行 “codeml.exe” 控 制 文件 。 
1.2.4 适应 性 进化 检测 ”分别 采用 了 PAMI4.1 (Nei 
等 , 2000) 中 的 3 个 模型 : 分 支 模型 (Yang，1998) 、 位 
点 模型 (Nielsen 和 Yang, 1998; Yang, 2000) ， 及 分 支 位 
点 模型 (Yang 和 Wong, 2005; Zhang “4, 2005) 进行 检 
测 分 析 。 

在 分 支 模 型 中 ， 进 行 了 单 比 率 (one-ratio) FA 
比率 (free-ratio) 模型 分 析 。 单 比率 模型 假定 进化 树 上 

















































































































































































































6 期 于 丽 霞 等 : MIEP lea3 基因 的 进化 分 析 709 








所 有 分 支 的 比率 相同 ， 属 于 最 简单 模型 ， 用 w 表 示 ; A 
由 比率 模型 是 全 类 型 模型 ， 在 该 模型 下 假定 不 同 分 支 有 
不 同比 率 。 该 模型 的 优势 在 于 ， 当 缺少 序列 信息 时 ， 佑 
测 w 值 不 受 影 响 ， 但 由 于 参数 较 多 ， 可 能 导致 不 精确 的 
w 值 出 现 。 

在 位 点 模型 中 ， 假 定 不 同位 点 经 历 了 不 同 选择 压 

力 ， 而 在 系统 树 上 的 不 同 分 支 上 则 无 差异 。 在 本 研究 中 
将 3 对 模型 的 数据 分 别 进 行 了 似 然 比 值 检 验 (likelihood 
ratio test，LTR) 。 这 三 对 模型 为 M, ( 近 中 性 模型 ) vs M, 
( 正 选 择 模型 ) M, (beta 模型 ) vs M; (beta & œ 模型 ) 、 
M,, (beta) vs My (beta & v) (Nielsen 和 Yang, 1998; 
Yang, 2000) 。 在 对 三 对 模型 的 数据 进行 LRT 检验 时 ， 
使 用 统计 量 -2A4 (其 中 的 AC=e,-¢,, ¢, 和 如 分 别 表示 
两 个 模型 下 的 似 然 值 ) 依 妨 卡 方 分 布 检验 显著 性 ， 自 由 
度 为 两 个 模型 参数 的 数值 之 差 。 
在 分 支 位 点 模型 中 ， 根 dv/ds 的 四 类 比率 区 分 不 同 
位 点 。 第 一 类 由 所 有 分 支 中 高 度 保守 的 位 点 组 成 ， 其 中 
的 d\Xds 比 率 o B/D; 第 二 类 由 处 于 中 性 进化 的 位 点 组 
成 其 dy/ds 比 率 w 等 于 1; 第 三 类 由 背景 分 支 高 度 保 
SF (0<wu<1) ， 同 时 前 景 分 支 比 率 o WERT 1 的 位 点 
组 成 ; 第 四 类 指 背 景 分 支 处 于 中 性 进化 (oo=1) ， 但 前 
景 分 支 比率 w, 显 著 大 于 1 的 位 点 组 成 。 其 中 第 三 类 与 第 
四 类 中 的 w, 数 值 相同 。 分 支 位 点 模型 包括 A 和 B 两 个 模 
型 (Nielsen 和 Yang, 1998; Yang, 2000), A 模型 下 又 包 
括 2 个 检验 : 检验 1 和 检验 2。 通常 采 用 检验 2。 在 检验 
2 中 ， 零 假设 下 假定 所 有 分 支 中 只 有 两 类 位 点 ，0<w。<1 
和 wl, 控制 文件 中 需要 设 定 fix_omega= 1 及 omega = 
1。 备 选 假设 比 零 假设 多 2 个 参数 p 和 w,， 其 中 的 o, 
大 于 或 等 于 1， 如 结果 w, >1 就 说 明 前 分 上 存在 正 选择 
位 点 。 

































































































































































2 结果 与 分 析 
2.1 竹 亚 科 lea3 基因 拼接 序列 的 获得 

利用 通用 引物 FP 和 RP 经 RT-PCR 成 功 地 
从 竹子 的 cDNA 中 扩 增 出 长 度 约 为 500 bp 左右 的 
片段 ,与 预计 扩 增 的 长 度 相 符 。 利 用 已 获得 的 这 
段 序列 设计 了 3' RACE 引物 ， 第 一 轮 3'-Race- 
PCR 扩 增 的 产物 经 琼脂 糖 凝 胶 电泳 检测 ， 结 
凝 胶 电泳 图 上 的 泳 道 中 均 显 示 出 明亮 的 “Smear” 
状 条 带 ， 这 说 明了 在 RACE-PCR 条 件 下 用 3’ 端 
引物 扩展 特异 性 差 ， 目 的 条 带 不 明显 。 以 第 一 轮 
扩 增 产物 稀释 10 倍 为 模板 ， 进 行 第 二 轮 3”- 
Race-PCR， 将 扩 增 的 产物 分 别 回收 、 纯 化 、 及 
克隆 测序 ， 与 通用 引物 扩 增 的 保守 区 域 片段 拼 
接 ， 得 到 了 部 分 cDNA 序列 ， 大 小 分 别 为 泰 竹 


























540 bp 、 风 尾 竹 531 bp, FET 540 bp, AMT RAPT 
552 bp, R(T 552 bp、 野 龙 竹 552 bp, E17 585 bp, 
AT 552 bp, trit 552 bp, JEATT 546 bp, 
2.2 基因 树 的 构建 

最 大 似 然 法 是 根据 特定 替代 模型 分 析 既 定 的 
一 组 序列 数据 ， 从 而 使 所 获得 的 每 一 个 拓扑 结构 
的 似 然 值 最 大 ， 然 后 挑选 出 其 中 似 然 值 最 大 的 拓 
扑 结构 作为 最 优 系统 树 ( Huelsenbeck 和 Ranna- 
la, 1997; Yang, 1998)。 根 据 已 有 资料 显示 ， 如 
果 模 型 合适 ，ML 效果 较 好 (Saiton 和 Nei, 1987; 
Hasegawa 等 ,1991) 。 将 用 于 比 对 的 序列 经 MEGA 
中 的 “Translated Protein Sequences” 转 换 后 ， 用 
其 中 的 “Align by ClustalW “进行 序列 比 对 ， 手 
动 去 除 “Gap”， 最 后 将 这 些 序 列 用 于 建树 。 以 
ML 法 构建 的 进化 树 为 树 文 件 ， 利 用 PAML 软件 
对 11 条 lea3 基因 序列 进行 进化 分 析 (图 1)。 从 
图 中 可 以 看 出 ， 禾 本 科 稻 属 的 水 稳 与 任何 一 种 人 竹 
FWY PRK AR Be, RAPT AIK ARR KA E 
i, KLSENABHTHOAWA; RR 
AY RUE TYAS RAK AR AIP MRI, CHT HE 
与 它们 的 生境 不 同 有 关 
2.3 EF lea3 基因 的 选择 压力 检测 结果 
2.3.1 正 选 择 压 力 检测 结果 ” 单 比 率 模型 (onera- 
tion) 假定 所 有 分 支 都 具有 相同 的 w 值 ， 涉 及 参数 
21 个 。 在 该 模型 下 ， 似 然 值 为 {, = -2296. 944859, 
K=1. 63425, {hill w 值 为 0.36203 ( 表 1)。 在 
分 支 模型 中 ， 自 由 比率 模型 (free-ratio) 假定 每 
个 分 支 都 有 独立 的 ww 值 ， 包 括 参 数 39 个 ， 似 然 
值 为 t1 = -2289. 125585。 因 为 自由 比率 模型 比 
单 比率 模型 多 18 个 参数 ， 所 以 2AC=2 (€,-£,) 
= 15.65， 自 由 度 df= 18。 同 时 ， 数据 显示 不 同 
分 支 所 受 选择 压力 各 异 ， 多 数 分 支 处 于 强烈 清除 
选择 压力 下 (wo<1) ， 少 数 分 支 处 于 正 选择 压力 
F (w>1)。 通 过 似 然 比 值 检 验 分 析 显 示 ( 表 
2) ， 在 自由 比率 模型 vs. 单 比率 模型 的 检测 中 ， 
2A€=15.64, P=0.618, df=18, 

在 分 支 位 点 模型 中 ，a-s 表示 分 支 ， 当 p ”或 
r 表示 前 景 分 支 时 ， 其 它 分 支 为 背景 分 文 。 在 此 模 
型 下 , 分 支 + 检测 到 两 个 正 选 择 位 点 (P > 0.9: 
34K P>0.6; 32D) ( 表 1)。 通 过 似 然 比 值 检验 分 
析 显 示 〈 表 2) ， 在 以 了 为 前 景 分 支 的 零 假 设 vs. 备 
选 假设 检测 中 ，2AL =3.82，P=0.051=5%，df=1。 
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0.4682 
0.1482 i Phyllostachys heterocycla. fas 
0.6900 F 5 
0.1569 l 5 Chimonocalamus delicates. fas 
m 
94.2914 = Dendrocalamus semiscandens. fas 
0.3109 。 
F Thyrsostachys siamensis. fas 
0.0513 ‘ 
0.468 o 0.0001 : Sasa fortunei. fas 
q 
R z Bambusa multiplex. fas 
0.1549 
D Bambusa textilis. fas 
° 0.3424 . 
Pleioblastus amarus. fas 
0.5080 h 
r Neosinocalamus affinis. fas 
3 一 Dendrocalamus farinosus. fas 
0.2450 J 
Oryza sativa. fas 





图 1 FA PAML 分 析 的 ML 树 。1 000 次 重复 的 














自 展 支 持 率 ， 分支 上 的 数字 表示 自由 比率 模型 “free-ratio” 得 到 的 w E, a-s 为 分 支 代号 
































Fig.1 ML tree of the PAML analysis. 1 000 replicates bootstrap support rate. Branch on the numbers indicate the 
free-ratio model œw value in “free-ratio” , a-s; the branch code 
R1 人 竹 亚 科 植物 ea3 基因 片段 在 不 同 模型 下 的 参数 估计 值 以 及 对 数 似 然 值 
Table 1 Parameter estimates and Log-Likelihood values of the lea3 gene in gymnosperm under different models 
BTS 以 然 什 i ， 
模型 Model 数 wy e 什 ts/tv 参数 估 测 值 Estimates of parameters 下 选择 位 点 Positively selected sites 
M0: 单 比率 
一 . =0. 36 > 
(MO: one-ratio) 21 2296. 95 1.63 Wo None 
分 支 模型 
由 比率 r; 39 —2289. 13 1.63 Wj=% Wi=% wr=o wp=o wc=oo None 
( Free-ratio ) 
位 点 模型 
M1: 中 性 0=0.60, (p1=0. 40) i 
(M1: neutral) 22 2104. 52 2.27 o0=0.03, wl=1 Not allowed 
P>0.99; 24 R, 29T, 47K, 54 A, 
选择 2 Š = 
M2: 选择 24 _2063 59 2.43 0=0. 53, p1=0.29, p2= 0.18 58 K, 59A, 62 A, 69R, 71H, 76 
(M2; selection) w0=0.04, wl=1, w2=8.32 Q, 81 I, 82 G, 104 L; P> 0.95; 
50 G, 56 K, 79S 
M7: (beta) 22 —2101. 34 2:25 =0.16, q=0.29 Not allowed 
P>0.99; 24 R, 29T, 47K, 54A 
p0=0. 81, p=0. 18, q= 0.45, : : i 7 ` 
F 58 K, 59A, 62 A, 69R, 71H, 76 
M8; (beta & œ) 24 2061. 34 2. 42 eras Q. 81 I, 82 G, 104 L; P> 0.95; 
Ban 50 G, 56 K, 57E, 60 F, 79S 
p0=0.71, p=0.31, q=3.46, 
M8a 23 —2096. 98 2. 28 (pl= 0.29) None 
w=1 
分 支 位 点 模型 
模型 A (model A) 
=0. =0. 3= 
加 24 2104.52 227 PO=0.60, pl=0.40, CeO) Mone 
w2= 1 
r* 24 -2101.81 2.29 BO=O.57, p1=0.39, (p2+p3=0.0) p>0.9; 34K P>0.6; 32D 


ay 
t 





w2=12. 72 


型 检测 正 选择 位 点 时 ， 分 支 q 与 分 支 + 是 前 景 分 支 


Note; P number of parameters in the model; wo is the dy/ds ratio for all branches, w, and œ, are the dy/ds ratios for branches q and r; branches 


q and r are the foreground branches 


E: P 为 模型 中 参数 的 数目 ; oo TRA EN dy/ds, 0,5 mw, 分别 是 分 支 q s 分支 上 的 dy/ds; q* 与 r* 表示 在 用 分 支 位 点 模 
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R2 ， 似 然 比值 检验 统计 量 (2AC) 
Table 2 Likelihood ratio statistics (2A《) 





模型 对 比 Comparison 2A€ 自由 度 df 概率 PP 

F vs. MO 模型 15. 64 18 0. 618 

M1 (中 性 ) vs. M2 (选择 ) 81. 85 2 1. 68586E-18 
M7 (beta) vs. M8 (beta & v) 80. 01 2 4, 23239E-18 
M8a (beta) vs. M8 (beta & v) 71. 28 1 3. 0992E-17 
q*: 零 假 设 vs. 备 选 假设 0 1 1 

r”: 零 假 设 vs. 备 选 假设 3. 82 1 0. 051 








TE: 显著 : P<5%, X°=3.84; 极 显著 : P<1%, X? =6.63, E-18=1078 


Note; Significant; (P<5%, X? =3. 84); Extremely significant; (P< 1%, X?=6.63). E-18=107'8 


在 位 点 模型 中 ，M2 模型 和 M8 模型 均 检 测 
到 13 个 一 样 的 极 显 著 正 选择 位 点 (w>1, P> 
99， 占 8.02%) ( 表 1) ， 及 多 个 显著 正 选 择 位 
点 (@>1, P>0.95, 占 3.09%)。 这 18 个 正 选 
择 位 点 的 定位 见 图 3。 同 时 ， 在 M8 模型 下 还 检 
测 到 62 个 强烈 清除 选择 位 点 ， 占 总 氨基 酸 位 点 
数 的 38.3%。 经 分 析 后 发 现 ， 在 这 些 强 烈 清 除 





















































果 显 示 (#2): M1 vs.M2: 2A€= 81.85, P= 
1. 68586E-18< 1%, df=2; M7vs. M8; 2A€ = 80.01, 
P=4, 23239E-18 <1%, df=2; M8a vs. M8; 2A€ 
=71.28, P=3.0992E-17<1%, df=1, 

2.3.2 负 选 择 压力 检测 结果 “本 研究 中 共 检 测 
到 了 65 个 后 验 平均 w 值 小 于 0.1 的 极 强 烈 负 选 
择 位 点 ， 同 时 发 现在 46D-74T 之 间 存 在 一 长 段 没 


























选择 位 点 间 存 在 一 段 长 段 无 强烈 清除 选择 位 点 有 极 强烈 负 选 择 位 点 出 现 的 区 域 (结果 如 表 3 
的 区 域 (图 2 中 方 框 部 分 )。 似 然 比 值 检验 结 MR). 
表 3 Ms 模型 下 清除 选择 位 点 的 后 验 平 均 w 值 
Table 3 Posterior mean w for the purifying selected sites under Mg model 
三 难 平 其 三 验 平 扶 三 验 平 扶 
fil Site healers w PE Site y w 位 点 Site head w 

1A 0. 070 75 E 0. 061 126 V 0. 063 
2G 0. 062 84T 0. 067 127 G 0. 062 
3E 0. 061 87 A 0. 070 128 A 0. 070 
5K 0. 061 88 A 0. 072 129 K 0. 061 
9E 0. 061 89 K 0. 063 130 D 0. 061 
10 E 0. 061 90 Q 0. 081 131 A 0. 071 
11 K 0. 061 91K 0. 061 132 V 0. 063 
13 G 0. 063 96 A 0. 071 133 M 0. 069 
17 G 0. 062 98 Y 0. 078 135 T 0. 068 
22 K 0. 072 100 K 0. 061 137 G 0. 063 
23 A 0. 071 105 A 0. 070 138 M 0. 069 
25 E 0. 061 106 G 0. 062 141 D 0. 061 
26 A 0. 070 107 K 0. 061 143 G 0. 062 
27K 0. 061 108 D 0. 061 146 D 0. 094 
28 D 0. 061 110 T 0. 067 150 K 0. 061 
35 E 0. 061 111 G 0. 062 151 D 0. 061 
36 A 0. 071 113 V 0. 062 152 T 153:5 
37T 0. 067 116 Q 0. 081 154 A 0. 070 
38 K 0. 061 117 A 0. 070 155 T 0. 078 
41 A 0. 070 119 E 0. 061 156 E 0. 061 
46 D 0. 061 120 Q 0. 081 160 R 0. 065 
74T 0. 067 121 V 0. 063 
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1. N. affinis. fas AGEAKARAEEKTGYVMGAAQEKAREAKDTAS----------- DAKEATKEKACE 


3. D. farinosus. fas 
4. S. fortunei. fas 


5. T. siamensis. fas 


7. B. textilis. fas 


10. P. amarus. fas 
11. O. sativa. fas 





1. N. affinis. fas 

2. P. heterocycla. fas 

3. D. farinosus. fas 

4. S. fortunei. fas 

5. T. siamensis. fas 

6. B. multiplex. fas 

7. B. textilis. fas 
8. D. semiscandens. fas 
9. C. delicates. fas 

10. P. amarus. fas 
11. O. sativa. fas 





N. affinis. fas 

P. heterocycla. fas 
D. farinosus. fas 

. S. fortunei. fas 

. T. siamensis. fas 

. B. multiplex. fas 

. B. textilis. fas 

. D. semiscandens. fas 


. C. delicates. fas 








11. O. sativa. fas 


2. P. heterocycla. fas 


6. B. multiplex. fas 


8. D. semiscandens. fas 
9. C. delicates. fas 


AGEAKGRTEEKVGHAMGVTKDKAYEAKDRGS 
AGETKGRAEEKTGYVMGAAQEKAREAKDTAS DAKEATKEKACE 
AGETKARTEEKAGHVMGSTKDKAYEAKDRAS DAAGQAAGKGHDAKEATKDKAYE 
AGETKGRTEEKAGHVMGATKDKAYEAKDRALDAAGQAAGKGHDAKEATKDKAYE 
AGEAKGRTEEKAGHVMGSTKDKAYEAKDRAS DAAGQAAGKGHDAKEATKDKAYE 
AGETKGRTEEKAGHVMGATKDKAYEAKDRAS DAAGQAAGKGHDAKEATKDKAYE 
AGETKGRTEEKAGHVMGATKDKAYEAKDRAS DAAGQAAGKGHDAKEATKDKAYE 
AGETKGRTEEKAGHAMGVTKDKAYEAKDRGS DAAGHAAGEGHAAGEATKGKAWE 
AGEAKGRAEEKAGYVIGAAREKAREAKDTASDAAGRAMGRGQDAKEATKEKAYE 
AGETKAHTEEKAGQVMGASKDKASEAKDRAS EAAGHAAGKGQDTKEATKEKAQA 


VAAGHAAGEGHDAKEATKG-.-- - 

















AKDRASETAQAAKDIRAGEGKDQTGS 
AKDKASETAQAAKDIRAGEGKDQTGS 
AKDKASETAQAAKD/IRAGGGKDQTGS 
AKDKASETAQAAKDIRAGGGKDQTGS 
AKDKASETAQAAKDIRACEGKDQTGS 


ADAAKQKAADAAQYAKETALAGKDKTGS VLQQAGEQVK 


VYIGOT+ 2 e326 Bee 285 
KAS ET s- 526 544 2.46 AEAAKQKTSDAAQYTKDSAVAGKDKTGAVLQQAGEQVK 
VIGOTs- 262242242 ADAAKQKAADAAQYAKETAPAGKDKTGSVLQQAGEQVK 
KAAET----------- TEAAKQKTS DAAQYAKDSAVAGKDKTGSVLQQAGEQVK 
KAAE Toc eis oS 7a TEAAKQKTS DAAQYAKDSAVAGKDKTGSVLQQAGEQVK 
KAAET----------- TEAAKQKTS DAAQYAKDSAVAGKDKTGSVLQQAGEQVK 


KAAETTEATKOKAAETTEAAKQOKTSDAAQYAKDSAVAGKDKTGSVLQQAGEQVK 


KASET----------- TEAAKQKTSDAAQYAKDSAVAGKDKTGSVLQQAGEQVK 
KASET----------- AEAAKQKTSDAAQYTKDSTVAGKDKTGAVLQQAGEQVT 
YVGQT----------- AEAAKQKAAGAALYAKETALAGKDKTGAVLQQAGEQVK 
KAAET----------- AGAAKQKTAETAQYTKDSAIAGKDKTGSVLQQASEQVK 























1. N. affinis. fas NVAVGAKDAVMNTLGMAGDK-GSDDSTTKDTS----ATETITRDR 
2. P. heterocycla. fas SAAVGAKDAVMNTLGMGGDK-GGADSTTKDTS----ATETITRDR 
3. D. farinosus. fas NVAVGAKDAVMNTLGMAGDK-GSDDSTTKDTS----ATETITRDR 
4. S. fortunei. fas NVAVGAKDAVMNTLGMAGDK-GSDDSTTKDTS----ATETITRDR 
5. T. siamensis. fas NVAVGAKDAVMNTLGMAGDK-GSDDSTTKDTS----ATETITRDR 
6. B. multiplex. fas NAAVGAKDAVMNTLGMAGDK-GSDDSTTKDTS----ATETITRDR 
7. B. textilis. fas NAAVGAKDAVMNTLGMAGDK-GSDDSTTKDTS----ATETITRDR 
8. D. semiscandens. fas |NVAVGAKDAVMNTLGMAGDK-GSDDSTTKDTS----ATETITRDR 
9. C. delicates. fas SAAVGAKDAVMNTLGMGGDK-GRADSTTKDTS----ATETITRDR 
10. P. amarus. fas SAAVGAKDAVMNTLGMGGDK-GGADSTTKDTS----ATETITRDR 
11. O. sativa. fas STVVGAKDAVMSTLGMTEDEAGTDDGANKDTSATAAATETTARDH 
图 2 ” 竹 亚 科 与 外 类 群 水 稻 的 氨基 酸 序列 比 对 图 
TE, 方 框 内 的 为 无 强烈 清除 选择 位 点 区 域 ;“* ”号 为 正 选择 位 点 ; 底部 的 粗 下 划 线 部 分 代表 含有 11 个 氨基 酸 的 串联 重复 区 ; 
































双 下 


Note: inside the box for strong clear select site region ; 


划 线 代表 含有 11 个 氨基 酸 的 串联 重复 基 元 序列 ; 单 下 划 线 代表 含有 相对 稳定 结构 的 特殊 序列 ; 
三 下 划 线 代表 有 疑问 的 11 个 氨基 酸 的 串联 重复 基 元 序列 


Fig.2 Bamboosubfamilies and outgroup Oryza sativa’ s acid sequence comparing figure 











“ 


‘x ” for positive selection sites; underline the 11 amino acids by tandem repeats; 


double underline representation containing 11 amino acids by tandem repeat sequence of primitive elements; single underline 


representative contain relatively stable structure of insertion sequences; three underline on behalf of questionable 11 


amino acids of the tandem repeat sequence of primitive elements 
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2.4 HEF lea3 基因 的 检测 结果 定位 

将 检测 到 的 正 选择 位 点 、 无 强烈 负 选 择 位 点 
的 长 段 区 域 、11 个 氨基 酸 的 串联 重复 序列 及 特 
殊 序 列 在 氨基 酸 序 列 比 对 图 上 进行 定位 。 定 位 后 
的 结果 如 图 2 所 示 。 图 中 11 个 氨基 酸 串 联 重复 
序列 区 包括 91 个 氨基 酸 ， 占 总 长 度 207 个 氨基 
酸 的 44% 左 右 (图 中 加 粗 线 的 部 分 ) 。 

本 研究 检测 出 的 18 个 正 选择 位 点 中 15 个 位 
于 11 个 氨基 酸 的 串联 重复 序列 区 (下 图 中 加 粗 
线 的 部 分 ) ，3 个 位 于 插入 片段 区 (下 图 中 加 单 
下 划 线 的 部 分 ) 。 检 测 到 的 无 强烈 负 选 择 位 点 的 
长 段 区域 共 含有 34 个 氨基 酸 位 点 ， 位 于 11 个 氮 
基 酸 串联 重复 序列 中 间 位 置 (下 图 中 用 方 框 标 
记 的 部 分 ) 。 

















3 讨论 
3.1 竹 亚 科 lea3 基因 中 检测 到 的 正 选择 分 支 

分 支 模 型 的 检测 结果 显示 ， 不同 竹 种 所 含 
lea3 基因 所 承受 的 正 选 择 压力 不 同 。 原 因 可 能 是 
由 于 不 同 竹 种 所 处 的 生境 不 同 ， 从 而 经 历 了 不 同 
的 上 自然 选择 作用 。 在 分 支 位 点 模型 中 ， 将 分 支 q 
与 分 文 + 进行 配对 检测 ， 在 分 文 q 上 没有 检测 到 
正 选 择 位 点 ， 在 + 分支 上 检测 到 两 个 正 选 择 位 
点 。 这 说 明 不 同人 竹 种 因 所 处 生境 的 不 同 而 经 历 了 
不 同 的 自然 选择 作用 。 
3.2 人 竹 亚 科 lea3 基因 中 检测 到 的 正 选 择 位 点 

在 位 点 模型 中 共 检 测 到 5 个 显著 正 选 择 位 点 
和 13 个 极 显著 正 选择 位 点 。 相 比 于 其 它 基因 ， 
lea3 基因 中 所 存在 的 正 选择 位 点 数目 较 多 。 已 有 
研究 结果 表明 ， 抗 病 及 抗旱 类 奢侈 基因 (luxury 
gene) 中 所 检测 到 的 正 选择 位 点 数 明显 多 于 与 光 
合作 用 有 关 的 看 家 基 ( house-keeping gene ) 
(FY, 2012) 。 这 显示 抗 病 及 抗旱 类 奢侈 基因 相 
比 于 与 光合 作用 有 关 的 看 家 基因 更 容易 受到 上 自然 
选择 作用 影响 。 根 据 中 性 进化 原理 ， 基 因 突 变 率 
在 没有 受到 强烈 理化 因子 刺激 时 几乎 不 变 。 针 对 
竹 亚 科 lea3 基因 中 存在 较 多 正 选择 位 点 的 现象 ， 
可 能 是 由 于 该 基因 属于 奢侈 基因 ， 相 比 于 其 它 看 
家 基因 所 受到 的 自然 选择 压力 较 小 ， 位 点 突变 更 
容易 被 保留 下 来 。 

通过 对 18 个 正 选择 位 点 进行 定位 ， 发 现 其 
中 15 个 极 显著 正 位 点 位 于 11 个 氮 基 酸 串 联 重 复 


























































































































序列 区 内 ，3 个 位 点 位 于 7 个 特殊 的 氨基 酸 序列 
= 这 说 明 11 个 氨基 酸 串 联 重复 序列 区 比 基 因 

它 部 分 更 容易 受 自 然 选 择 作用 影响 。 原 因 推 测 

可 能 与 11 个 氨 基 酸 串联 重复 序列 所 形成 的 特殊 
ee ne eee 
以 形成 a- 螺 旋 结 构 ， 而 w- 螺 旋 的 疏水 界面 又 可 
形成 同型 二 聚 体 结构 ， 这 种 同型 二 聚 体 结构 能 在 
植物 受到 干旱 胁迫 时 保护 生物 大 分 子 ， 减轻 水 份 
胁迫 伤害 ， 与 植物 抗旱 性 密切 相关 。 
3.3 ”人 竹 亚 科 lea3 基因 中 检测 到 的 强烈 清 
位 点 

将 负 选 择 位 点 数目 与 正 选择 位 点 数目 进行 比 
较 ， 发 现 前 者 远大 于 后 者 。 这 说 明 lea3 基因 尽 
管 受 到 较 强 正 选择 压力 ， 但 清除 选择 作用 依然 占 
主导 地 位 。 对 所 检测 到 的 65 个 强烈 清除 选择 位 
点 进行 观察 后 ,发现 其 间 存 在 一 长 段 无 强烈 清除 
选择 位 点 的 区 域 。 这 段 无 强烈 清除 选择 位 点 的 区 
域 位 于 靠近 11 个 氨基 酸 串 联 重复 序列 区 中 心 部 
位 ， 同 时 ,该 区 域 也 是 正 选择 位 点 最 集中 的 区 域 。 
这 说 明 这 段 无 强烈 清除 选择 位 点 的 区 域 所 受到 的 
清除 选择 压力 极 小 ， 正 选择 压力 占 主导 地 位 。 
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